رفع اختلاف مقادیر داده ای میان موجودیت های همانند در وب داده ها

thesis
abstract

وب داده های پیوندی به سرعت در حال گسترش می باشد و در حال حاضر شامل داده هایی از صدها مجموعه داده ی متفاوت می باشد. کیفیت داده های این مجموعه داده ها بسیار متغیر است، به طوریکه ممکن است این داده ها قدیمی، ناقص و یا نادرست باشند. از طرف دیگر امکان دارد مجموعه داده ها اطلاعات متناقضی درمورد یک موجودیت واحد در جهان واقعی ارائه کنند. به منظور استفاده ی برنامه های کاربردی داده های پیوندی از این فضای سراسری داده ها، چالش هایی بوجود آمده است. یکی از این چالش ها رفع اختلاف مقادیر داده ای است، در شرایطی که مجموعه داده های مختلف مقادیر متفاوتی برای یک موجودیت یکسان در جهان واقعی در نظر گرفته اند. در این تحقیق الگوریتمی ارائه شده است تا صحیح ترین مقدار از بین مقادیر موجود انتخاب شود تا بدین صورت اختلاف بین مقادیر برطرف شود. الگوریتم ارائه شده از چهار بخش اصلی تشکیل شده است که شامل مراحل فیلترگذاری، تشخیص تکراری ها، بررسی آنتولوژی و بررسی اندازه می باشد. داده ها از یک دامنه دانش و از مجموعه داده های مختلف استخراج می شوند و به عنوان ورودی به الگوریتم داده می شود و در نهایت بهترین مقادیر برای خصوصیات یک موجودیت انتخاب می شود الگوریتم پیشنهادی با استفاده از زبان برنامه نویسی جاوا پیاده سازی و سپس روی مجموعه داده های متعلق به دامنه ی فیلم و مناطق جغرافیایی تست و ارزیابی گردیده است. نتایج بدست آمده در این دو دامنه دانش متفاوت می باشد و به کیفیت داده های منتشر شده وابسته است.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

شناسایی موجودیت های همانند در وب داده

وب داده به منظور ایجاد وب قابل فهم برای ماشین ها معرفی شده است که اتصالات معنادار بین موجودیت ها از ویژگی های اصلی آن است. یکی از مهم ترین اتصالات معنادار در وب داده، اتصالات همانندی است که بین موجودیت های همانند ایجاد می شود. شناسایی و اتصال موجودیت هایی که به یک موجودیت یکسان اشاره می کنند ولی دارای شناسه های یکتای منبع متفاوت هستند و در مجموعه داده های مختلفی قرار دارند، موجب می شود عامل ها ...

15 صفحه اول

رتبه بندی موجودیت در وب داده

امروزه، موتورهای جستجو به یکی از برنامه های کاربردی بسیار مهمِ وب تبدیل شده اند که هدف آن ها کمک به کاربر در جهت یافتن اطلاعات است. موتورهای جستجو همچون گوگل و یاهو کلمات کلیدی کاربر را دریافت می کنند و در صفحات وب بر اساس الگوریتم های از قبل تعریف شده به دنبال کلمات کلیدی وارد شده می گردند. سپس صفحات بازیابی شده را بر اساس الگوریتم رتبه بندی، مرتب و به کاربر نشان می دهند. با ظهور فناوری وب مع...

15 صفحه اول

مقایسه عناصر داده ای مجموعۀ حداقل داده های پرستاری

چکیده مقدمه: داده‌پردازی استاندارد نقش مهمی در مراقبت از بیمار ایفا می‌کند. داده‌های پرستاری، سطح اولیه انفورماتیک پرستاری را تشکیل می‌دهند. این داده‌ها، ابزار اصلی مورد استفاده برای ثبت شرح دقیق فرایند پرستاری از طریق روش‌شناسی ارزشیابی، تشخیص‌ها، مداخلات، پیامدها، مستندسازی و ارزیابی مراقبت بیمار هستند. همچنین نخستین اقدام برای استاندارد ‌کردن جمع‌آوری داده‌های یکسان و ضروری پرستاری برای ا...

full text

خوشه بندی موجودیت ها در داده های پیوندی

وب معنایی شامل قرار دادن داده ها روی وب و ساختن ارتباطات به گونه ای است که انسان و ماشین بتوانند محتوای وب داده را کاوش نمایند. هدف وب معنایی افزایش توانایی ماشین ها در دسترسی به منابع موجود در وب، پردازش و بکارگیری آن ها می باشد. با توجه به رشد گسترده ی داده های پیوندی و افزایش مجموعه داده ها در چند سال اخیر، نیاز به ابزاری برای کشف پیوند در مقیاس وسیع احساس می شود. ابزارهای کنونی برای کشف پیو...

15 صفحه اول

ارائه راهکاری جهت تجمیع داده ها در سازمانها با استفاده از وب سرویس

Increasing the speed and reducing the use of resources in the data integration process has always been the goal of developers and researchers in the process of data integration. The purpose of this study is to provide a solution using metadata as well as web browsing to speed up the process, so as to improve resources such as memory. The proposed solution is implemented using the three-layer ar...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023